Day 29 - Python網路爬蟲part2 - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2022 iThome 鐵人賽

DAY 29

自我挑戰組

Python簡單應用系列第 29 篇

Day 29 - Python網路爬蟲part2

14th鐵人賽 python

2022-10-11 00:47:47

1902 瀏覽

分享至

之前在做app時我們發生了一些問題，在爬蟲時，有時會非常不順利，爬到一半之後出錯，後來查資料後發現，那是因為他們可能會覺得我們是惡意再爬去資料，所以阻擋我們，我們可以將設計的爬蟲程式偽裝成瀏覽器，這方法就是在程式前加上header內容

import requests

headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64)\ AppleWebKit/537.36(KHTML, like Gecko) Chrome/76.0.3809.132 Safari/537.36', }

url = 'https://www.net-fashion.net/'
htmlfile = requests.get(url, headers = headers)
htmlfile.raise_for_status()
print("success")

可以看到跑出來success代表我偽裝瀏覽器成功，這樣在爬資料時，網頁就不會認為你在惡意攻擊